智能论文笔记

A Low-Cost Robot Science Kit for Education with Symbolic Regression for Hypothesis Discovery and Validation

Logan Saar , Haotong Liang , Alex Wang , Austin McDannald , Efrain Rodriguez , Ichiro Takeuchi , A. Gilad Kusne

分类：机器学习 | 机器人

2022-04-08

下一代物理科学涉及机器人科学家 - 自主物理科学系统，能够在封闭环中实验设计，执行和分析。这样的系统已显示出对科学探索和发现的现实成功，包括首次发现一流的材料。为了构建和使用这些系统，下一代劳动力需要在不同领域的专业知识，包括ML，控制系统，测量科学，材料合成，决策理论等。但是，教育滞后。教育工作者需要一个低成本，易于使用的平台来教授所需的技能。行业还可以使用这样的平台来开发和评估自主物理科学方法论。我们介绍了科学教育的下一代，这是建立低成本自治科学家的套件。该套件在马里兰州大学的两门课程中用于教授本科和研究生自治物理科学。我们以自主模型探索，优化和确定的双重任务来讨论其在课程中的用途及其更大的能力，并以自主实验的“发现”为例。

translated by 谷歌翻译

Continuation Path with Linear Convergence Rate

Eugene Ndiaye , Ichiro Takeuchi

分类：机器学习

2021-12-09

路径跟踪算法经常用于复合优化问题，其中一系列具有不同正则化超参数的子问题，顺序解决。通过将以前的解决方案重用为初始化，在数值上观察到更好的收敛速度。这使得它成为加速机器学习中优化算法的执行的相当有用的启发式。我们提出了路径跟踪算法的原始双重分析，并探索了如何设计其超参数，以及确定每个子问题的解决方案应该如何解决，以保证目标问题的线性收敛速度。此外，考虑用稀疏诱导惩罚的优化，我们分析了关于正则化参数的活动集的变化。然后可以自适应地校准后者以精细地确定沿解决方案路径选择的特征的数量。这导致简单的启发式校准主动集方法的超级参数，以降低他们的复杂性并提高他们的执行时间。

translated by 谷歌翻译

Bayesian Optimization for Cascade-type Multi-stage Processes

Shunya Kusakawa , Shion Takeno , Yu Inatsu , Kentaro Kutsukake , Shogo Iwazaki , Takashi Nakano , Toru Ujihara , Masayuki Karasuyama , Ichiro Takeuchi

分类： (统计)机器学习 | 机器学习

2021-11-16

科学和工程中的复杂过程通常被制定为多阶段决策问题。在本文中，我们考虑了一种称为级联过程的多级决策过程。级联过程是一个多级过程，其中一个级的输出用作下一阶段的输入。当每个阶段的成本昂贵时，难以详尽地搜索每个阶段的最佳可控参数。为了解决这个问题，我们将级联过程的优化作为贝叶斯优化框架的延伸，提出了两种类型的采集功能（AFS），基于可靠的间隔和预期的改进。我们调查所提出的AFS的理论特性，并通过数值实验证明其有效性。此外，我们考虑一个被称为悬架设置的延伸，其中我们被允许在多阶段决策过程中暂停级联过程，这些过程经常出现在实际问题中。我们在太阳能电池模拟器的优化问题中应用提出的方法，这是本研究的动机。

translated by 谷歌翻译

Physics in the Machine: Integrating Physical Knowledge in Autonomous Phase-Mapping

A. Gilad Kusne , Austin McDannald , Brian DeCost , Corey Oses , Cormac Toher , Stefano Curtarolo , Apurva Mehta , Ichiro Takeuchi

分类：机器学习

2021-11-15

在过去的几十年中，人工智能（AI）和更具体地进行机械学习的应用，对物理科学进行了显着扩展。特别是，科学知情的AI或科学AI从专注于数据分析到现在控制闭环自主系统中的实验设计，仿真，执行和分析。客串（闭环自主材料勘探和优化）算法采用科学AI来解决两项任务：学习材料系统的组成结构关系，鉴定具有最佳功能性的材料组合物。通过对此进行整合，对构图相图进行了筛选的加速材料，导致发现最佳相变存储器材料。这一成功的关键是能够引导后续测量来最大化构图结构关系或相位图的知识。在这项工作中，我们调查将不同水平的先前物理知识纳入Careo的自主阶段映射的益处。这包括使用来自AFLOW存储库的AB-Initio相位边界数据，这些数据已被示出为在作为先前使用时优化Careo的搜索。

translated by 谷歌翻译

Exact Statistical Inference for the Wasserstein Distance by Selective Inference

Vo Nguyen Le Duy , Ichiro Takeuchi

分类： (统计)机器学习 | 机器学习

2021-09-29

在本文中，我们研究了Wassersein距离的统计推断，吸引了很多关注，并已应用于各种机器学习任务。在文献中提出了几项研究，但几乎所有的研究都基于渐近近似，并且没有有限样的有效性。在本研究中，我们提出了一种精确的（非渐近）推理方法，用于由条件选择性推理（Si）的概念的启发的Wassersein距离。为了我们的知识，这是第一种方法，可以为Wassersein距离提供有限的样本覆盖保证的有效置信区间（CI），这不仅可以应用于一维问题，而且可以应用于多维问题。我们评估了在合成和现实世界数据集中所提出的方法的性能。

translated by 谷歌翻译

Case-based similar image retrieval for weakly annotated large histopathological images of malignant lymphoma using deep metric learning

Noriaki Hashimoto , Yusuke Takagi , Hiroki Masuda , Hiroaki Miyoshi , Kei Kohno , Miharu Nagaishi , Kensaku Sato , Mai Takeuchi , Takuya Furuta , Keisuke Kawamoto

分类：计算机视觉

2021-07-08

在本研究中，我们提出了一种基于病例的新型图像检索（SIR）方法，用于苏木精和曙红（H＆E）染色的恶性淋巴瘤的组织病理学图像。当将整个幻灯片图像（WSI）用作输入查询时，希望能够通过重点关注病理上重要区域（例如肿瘤细胞）中的图像斑块来检索相似情况。为了解决这个问题，我们采用了基于注意力的多个实例学习，这使我们能够在计算案例之间的相似性时专注于肿瘤特异性区域。此外，我们采用对比度距离度量学习将免疫组织化学（IHC）染色模式纳入有用的监督信息，以定义异质性恶性淋巴瘤病例之间的适当相似性。在对249例恶性淋巴瘤患者的实验中，我们证实该方法比基线基于病例的SIR方法表现出更高的评估措施。此外，病理学家的主观评估表明，我们使用IHC染色模式的相似性度量适用于代表恶性淋巴瘤H＆E染色组织图像的相似性。

translated by 谷歌翻译

Conditional Selective Inference for Robust Regression and Outlier Detection using Piecewise-Linear Homotopy Continuation

Toshiaki Tsukurimichi , Yu Inatsu , Vo Nguyen Le Duy , Ichiro Takeuchi

分类： (统计)机器学习 | 机器学习

2021-04-22

在嘈杂环境下的实际数据分析中，常常首先使用强大的方法来识别异常值，然后在删除异常值后进行进一步的分析。在本文中，我们考虑除去异常值后估计的模型的统计推断，可以解释为选择性推理（SI）问题。要使用条件SI框架，有必要表征鲁棒方法如何标识异常值的事件。遗憾的是，这里不能直接使用现有方法，因为它们适用于选择事件可以通过线性/二次约束表示的情况。在本文中，我们提出了通过使用同型方法对流行的鲁棒回归的条件SI方法。我们表明，所提出的条件SI方法适用于广泛的稳健回归和异常检测方法，对合成数据和实际数据实验具有良好的经验性能。

translated by 谷歌翻译

Root-finding Approaches for Computing Conformal Prediction Set

Eugene Ndiaye , Ichiro Takeuchi

分类： (统计)机器学习 | 机器学习

2021-04-14

Conformal prediction constructs a confidence set for an unobserved response of a feature vector based on previous identically distributed and exchangeable observations of responses and features. It has a coverage guarantee at any nominal level without additional assumptions on their distribution. Its computation deplorably requires a refitting procedure for all replacement candidates of the target response. In regression settings, this corresponds to an infinite number of model fits. Apart from relatively simple estimators that can be written as pieces of linear function of the response, efficiently computing such sets is difficult, and is still considered as an open problem. We exploit the fact that, \emph{often}, conformal prediction sets are intervals whose boundaries can be efficiently approximated by classical root-finding algorithms. We investigate how this approach can overcome many limitations of formerly used strategies; we discuss its complexity and drawbacks.

translated by 谷歌翻译

Quantifying Statistical Significance of Neural Network-based Image Segmentation by Selective Inference

Vo Nguyen Le Duy , Shogo Iwazaki , Ichiro Takeuchi

分类： (统计)机器学习 | 计算机视觉 | 机器学习

2020-10-05

虽然庞大的文献涉及使用深神经网络（DNN）的图像分割方法，但是已经支付了不太关注，以评估分割结果的统计可靠性。在这项研究中，我们将分割结果解释为由DNN（称为DNN驱动假设）驱动的假设，并提出一种方法，通过该方法来量化统计假设检测框架内这些假设的可靠性。具体而言，我们考虑对象和背景区域之间的差异统计假设试验。这个问题是具有挑战性的，因为由于DNN对数据的改编，差异将是错误的。为了克服这种困难，我们介绍了一个条件选择性推理（SI）框架 - 一个新的统计推理框架，用于数据驱动的假设，最近接受了相当大的关注 - 计算分割的精确（非渐近）有效的p值结果。为了使用基于DNN的分割的条件SI框架，我们开发了一种基于同型方法的新型SI算法，使我们能够导出DNN驱动假设的精确（非渐近）采样分布。我们在合成和现实世界数据集中进行实验，我们提供了证据表明我们所提出的方法可以成功控制错误阳性率，在计算效率方面具有良好的性能，并在应用于医学图像数据时提供良好的结果。

translated by 谷歌翻译

Interaction in Remote Peddling Using Avatar Robot by People with Disabilities

Takashi Kanetsuna , Kazuaki Takeuchi , Hiroaki Kato , Taichi Sono , Hirotaka Osawa , Kentaro Yoshifuji , Yoichi Yamazaki

分类：机器人

2022-12-02

Telework "avatar work," in which people with disabilities can engage in physical work such as customer service, is being implemented in society. In order to enable avatar work in a variety of occupations, we propose a mobile sales system using a mobile frozen drink machine and an avatar robot "OriHime", focusing on mobile customer service like peddling. The effect of the peddling by the system on the customers are examined based on the results of video annotation.

translated by 谷歌翻译